Bước tới nội dung

Sinh ngôn ngữ tự nhiên

Bách khoa toàn thư mở Wikipedia

Sinh ngôn ngữ tự nhiên (hay còn gọi là sản sinh ngôn ngữ tự nhiên, tạo sinh ngôn ngữ tự nhiên, phát sinh ngôn ngữ tự nhiên, tiếng Anh: natural-language generation, viết tắt NLG) là một quy trình phần mềm, chuyển đổi dữ liệu có cấu trúc thành ngôn ngữ tự nhiên.[1] NLG cũng có thể dùng để sản sinh dạng nội dung dài cho các tổ chức để tự động các báo cáo tùy chỉnh, cũng như sản sinh nội dung tùy chỉnh cho các ứng dụng web hay mobile. Sinh ngôn ngữ tự nhiên cũng có thể dùng để sản sinh các đoạn văn bản mờ ngắn trong các cuộc tương tác trò chuyện (thậm chí một chatbot có thể được đọc ra bởi một hệ thống tổng hợp giọng nói).

NLG được tự động có thể dùng để so sánh với quá trình mà con người sử dụng khi chuyển hóa các ý tưởng của mình thành văn bản hoặc bài phát biểu. Các nhà tâm lý học ưa thích sử dụng thuật ngữ sản xuất ngôn ngữ (language production) hơn cho quá trình này, cũng như có thể được diễn tả bằng các thuật ngữ toán học, hoặc mô hình hóa trong một máy tính cho nghiên cứu tâm lý.

Các hệ thống NLG cũng có thể được so sánh với các bộ phiên dịch các ngôn ngữ máy tính nhân tạo, chẳng hạn như các trình dịch ngược (decompiler) hay các trình biên dịch nguồn sang nguồn (source-to-source compiler), mà cũng tạo ra mã mà con người có thể đọc được, sản sinh từ một biểu diễn trung gian (intermediate representation). Ngôn ngữ con người thông thường có xu hướng phức tạp hơn một cách đáng kể và cho phép diễn đạt sự mơ hồ (ambiguity) hơn nhiều so với ngôn ngữ lập trình, điều này khiến việc giải quyết các bài toán về NLG trở nên thách thức hơn. Hiện tại, có hai phương pháp để đánh giá các hệ thống NLG: đánh giá con người và đo lường tự động.[2]

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ What is Natural Language Generation (NLG)?
  2. ^ “Google AI Blog: Evaluating Natural Language Generation with BLEURT”. Truy cập 23 tháng 2 năm 2021.

Đọc thêm

[sửa | sửa mã nguồn]

Liên kết ngoài

[sửa | sửa mã nguồn]